植物抽核案例:13分文章揭示拟南芥根系抽核单细胞研究优势│单细胞专题
在复杂的生物体中,各种细胞类型间具有一定的异质性,从而发挥着不同的生物学功能。单细胞技术发展迅速,主要是由于其能解决群体细胞异质性这一难题,在各组学中都得到了充分地应用。
植物也由不同的细胞类型组成,但单细胞测序技术在植物中的应用存在一定的限制,一直以来,植物单细胞通常采用制备原生质体的方式,但是原生质体制备也存在许多问题:
1.首先,植物细胞壁的存在使分离单个细胞变得困难,细胞壁水解酶的消化会影响相关基因的表达,进而对结果产生干扰;
2.某些特定类型的细胞不能通过消化细胞壁分离;
3.仪器对小体积的细胞具有偏好性;
4.现有的细胞壁水解流程对某些细胞壁组成复杂的细胞类型或某些植物物种不适用。
针对以上问题,下面这篇文章提出了一个解决办法,作者尝试对植物细胞进行抽核,分析抽核下的单细胞转录组和ATAC,并与原生质体制备下的单细胞结果进行了比较,为我们的植物单细胞研究提供了新思路。
论文标题:Single-nucleus RNA and ATAC sequencing reveals the impact of chromatin accessibility on gene expression in Arabidopsis roots at the single-cell level[1]
刊登日期:2021年3月
发表杂志:Molecular Plant
影响因子:13.164
研究机构:美国国家基因资源中心,内布拉斯加大学林肯分校等
研究思路:
图1 整体研究路线
1. 拟南芥根核产生具有生物学意义的转录组数据
图 2 拟南芥原生质体(橙色)和抽核(蓝色)单细胞转录组的UMAP聚类分析
本文首先对拟南芥根进行了抽核的单细胞转录组测序(sNucRNA-seq),同时对拟南芥根抽核和原生质体单细胞转录组(scRNA-seq)的结果进行了对比。其中,原生质体单细胞转录组scRNA-seq数据来自Ryu等人[2]。
为准确比较sNucRNA-seq和scRNA-seq结果,作者按照Ryu等人[2]的方法分离了初生根(发芽7天,分离150株幼苗的初生根),然后分离细胞核进行sNucRNA-seq(图1)。测得基因中位数为1124,在27420个拟南芥蛋白编码基因中鉴定出24510个基因表达(89.4%)。相比之下,Ryu等人共测定7437个拟南芥原生质体的转录组,基因中位数4739,共检测到25177个表达基因(91.8%)。
随后,作者将所有拟南芥根核与原生质体数据进行聚类(图2A)。拟南芥根核和原生质体分别被聚类为21和20个不同的簇(图2B)。两者之间有20个共同簇,其中,簇4和11主要来自sNucRNA-seq(超过89 %)(图2C),簇14只存在于sNucRNA-seq结果中(图1)。
为进一步评估sNucRNA-seq方法的生物学相关性,作者同时比较了sNucRNA-seq和scRNA-seq技术在20个共同簇中发现的蛋白质编码基因表达或不表达的百分比(图2C)。排除sNucRNA-seq特有的第14簇,sNucRNA-seq鉴定的每簇表达基因的百分比(从52.7%到73.3%)与scRNA-seq鉴定的每簇表达基因的百分比(从58.4%到75.2%)没有显著差异(t检验:P>0.421;图2C)。
这些结果表明,细胞原生质体转录本和核转录本提供了相似的转录信息,分离的植物细胞核可以用于在单细胞水平上建立转录信息。鉴定的三个新细胞簇,表明与scRNA-seq相比,sNucRNA-seq方法捕获了更多样化、更具代表性的拟南芥根细胞类型。
2. 拟南芥根细胞类群的鉴定
图3 拟南芥根细胞类型的功能注释
利用文献发表的拟南芥根单细胞转录组和有关根基因表达调控信息中的marker基因对细胞类群进行鉴定。最终在21个细胞簇中,确定了六大类细胞群:成毛体细胞(第1-3群)、非成毛体细胞(第4-7群)、分生组织细胞(第8-10群)、皮质细胞(第11和12群)、内胚层细胞(第13-16群)和中柱细胞(第17-21群)(图3A)。
UMAP图体现了细胞类型内和细胞类型间的关系。如,根的分生组织细胞(即簇8-10)位于UMAP图的中心,起源于这些分生组织细胞的几个细长的细胞突起(如簇3、6、7、12和13)以类似球形的簇结束(如簇1、2、5、11、15和18)(图3A)。细长的簇可能反映了细胞分化过程中转录程序的渐进性变化,而球形簇代表了组成拟南芥根的分化细胞。
sNucRNA-seq主要或独有的三个簇中(簇4、11和14)。簇14仅在sNucRNA-seq中存在,可以分为两个不同的亚群,分别具有内胚层(簇14a)和皮质标记基因(簇14b)活性(图3A)。簇14a是分化的内胚层细胞,其特征是细胞壁的硬脂化。簇14b的特征在于皮层特异性标记基因子集的表达,组成簇14b的皮层细胞在拟南芥表皮根细胞分化过程中发挥作用。簇4的特征是CEP1(AT5G50260)和EXI1(AT2G14095)的特异性表达,这两个基因以前被描述为根帽细胞死亡程序的调节基因,因此将簇4鉴定为根帽细胞。
3. 单细胞ATAC-seq揭示了染色质可及性对基因表达的影响
图4 sNucATAC-seq用于表征拟南芥根细胞类型之间染色质的差异折叠
常规RNA-seq和ATAC-seq间相关性较弱,这可能是由于细胞异质性的原因,此处作者为评估染色质可及性在控制植物基因在细胞和细胞类型之间表达的影响,对分离的拟南芥根核进行了sNucATAC-seq。观察到染色质可及区域大多位于包含顺式调控元件的转录起始点(TSS)上游的1000bp(图4A)和基因转录终止位点(TTS)周围(图4B)。同时,该数据与完整拟南芥根常规ATAC-seq结果[3]之间存在高度相关性(SRCC=0.95)。
接着作者通过sNucATAC-seq和sc/sNucRNA-seq联合分析,识别出11858个RNA-seq和 ATAC-seq 峰配对的基因,创建了21个sNucATAC-seq簇,对应于sc/sNucRNA-seq簇(图4C)。总体上sNucATAC-seq与sNuc/scRNA-seq的UMAP聚类结果类似, sNucATAC-seq的21个细胞簇也被分为类似的六大类细胞(图3A和4B),与未分化和分化细胞相关的簇(即簇8、9和10)位于UMAP图的中心,而与分化细胞相关的簇位于外围。表明染色质可及性和基因表达都可以作为分子标记来注释植物细胞类型,并可说明某些基因的染色质可及性与其转录活性之间存在相关性。
为了更好地估计sNucATAC-seq与Bulk ATAC-seq数据集在分辨率方面的增益,并估计sNucATAC-seq技术揭示染色质可及性离散变化的潜力。作者比较了拟南芥根核sNucATAC-seq和Bulk ATAC-seq图谱,总体上,两者主要峰相似,同时sNucATAC-seq中有额外的主峰出现,但只在21个类群的子集中特异表达(如簇14和15中AT1G56320的启动子区域的ATAC-seq峰)(图4D,4E)。表明单细胞ATAC-seq有可能揭示可及染色质的离散和细胞类型特异性位点。
图5 336个标记基因的基因表达与染色质可及性(x轴)和基因表达(y轴)的相关性分析
为进一步揭示sc/sNucRNA-seq和sNucATAC-seq之间的对应关系,作者对拟南芥标记基因的表达与其TSS位点染色质可及性之间的相关性进行了分析。观察到几乎所有共同注释的sc/sNucRNA-seq和sNucATAC-seq数据之间都存在显著的正相关(图5,p<10E-05)。证明了差异染色质可及性与至少几个簇标记基因的表达模式相关。
基于这些结果,表明与转录活性相似,选定基因TSS位置的染色质可及性可用作细胞类型同一性的分子标记。基因表达与染色质可及性之间的显著相关性表明,在基因组DNA双链上,靠近TSS的位置,核小体在控制一部分标记基因的活性方面起着关键作用。
4. 单细胞ATAC-seq下的染色质可及性可用作指示根毛和内胚层细胞发育状态的分子标记
图6 46个拟南芥基因的标准化表达水平(x轴),其特征是染色质在根毛(左)和内胚层(右)簇中TSS位置的可及性更高
基因表达和染色质可及性之间的相关性分析表明,染色质可及性也可以作为构成拟南芥根细胞类型的另一个分子标记。为进一步验证这一假设,作者重点对sNucRNA-seq数据中代表成熟的拟南芥根毛和内胚层细胞的三个和四个簇进行了分析(即簇1、2和3,以及簇13、14、15和16;图3A)。首先寻找在以上根毛和内胚层细胞簇中优先识别的sNucATAC-seq峰,在所有与TSS 配对的峰中,根毛和内胚层簇中分别特异性鉴定了20和26个sNucATAC-seq峰。通过scRNA-seq和sNucRNA-seq数据,分别鉴定出19(95%)和25个(96.2%)基因在拟南芥根毛和内胚层细胞中优先表达(图6)。对第1、2和3簇以及第13、14、15和16簇的可及染色质峰进行分析,鉴定到了相关的根毛和内皮标记基因。
以上结果除了表明染色质可及性在植物细胞中有控制基因表达的作用外,还强调了染色质可及性可以作为一种分子标记来注释特定的细胞类型。
总结:
作者在本文中报道了拟南芥根组织中单细胞核RNA测序(sNucRNA-seq)和单个核的ATAC测序(sNucATAC-seq)。通过与已发表的原生质体转录组比较,验证了本文单细胞核转录组测序中利用细胞核进行植物细胞类型特异性转录组建立的可靠性。此外,sNucRNA-seq的结果揭示了之前单细胞RNA-seq并未鉴定到的新的细胞类型。与sNucRNA-seq的结果类似,sNucATAC-seq的结果将拟南芥的细胞核分布到不同的簇中,这表明染色质在不同的细胞群之间根据其细胞类型的不同,染色质可及性也是明显不同。为了揭示染色质可及性对基因转录的影响,作者整合了sNucRNA-seq和sNucATAC-seq数据,发现细胞类型特异性标记基因显示出细胞类型特异性的染色质可及性模式。本文的数据表明,差异染色质可及性是细胞类型水平上调节基因活性的关键机制。
参考文献:
[1] Farmer A, Thibivilliers S, Ryu KH, Schiefelbein J, Libault M. Single-nucleus RNA and ATAC sequencing reveals the impact of chromatin accessibility on gene expression in Arabidopsis roots at the single-cell level. Mol Plant. 2021 Mar 1;14(3):372-383.
[2] Ryu KH, Huang L, Kang HM, Schiefelbein J. Single-Cell RNA Sequencing Resolves Molecular Relationships Among Individual Plant Cells. Plant Physiol. 2019 Apr;179(4):1444-1456.
[3] Maher KA, Bajic M, Kajala K, Reynoso M, Pauluzzi G, et, al. Profiling of Accessible Chromatin Regions across Multiple Plant Species and Cell Types Reveals Common Gene Regulatory Principles and New Control Modules. Plant Cell. 2018 Jan;30(1):15-36.
所见即所得,绘图高规格联川云平台,让科研更自由